Отказоустойчивость систем хранения данных АЭРОДИСК под нагрузкой
25.03.2024
В условиях импортозамещения заказчики проявляют активный интерес к отечественному ИТ-оборудованию, в частности, к российским СХД. При этом одним из ключевых требований, предъявляемых к этому виду оборудования, является надежность. Системы хранения АЭРОДИСК пользуются заслуженной популярностью у заказчиков в том числе благодаря высокой отказоустойчивости. Системы хранения серии АЭРОДИСК 5 (в серию входят модели Aerodisk Восток-5 и Aerodisk ENGINE-5 используют протокол ALUA (Asymmetric Logical Units Access) для обеспечения отказоустойчивости. Он позволяет управлять путями к логическим томам в система хранения данных с асимметричным доступом. Для режима Active-Active – ALUA часть путей является активными и оптимальными, а часть активными и неоптимальными. В роли владельца логического тома выступает контроллер с оптимальными путями. Неоптимальные пути используются для прохождения трафика только в случае отказа оптимальных путей.
В рамках тестирования работы протокола использовалась система следующей конфигурации:
- сервер Linux с шестью процессорными ядрами по 1,70 ГГц, 64 ГБ оперативной памяти и двумя адаптерами FC;
- коммутатор FC 16G;
- система хранения данных Аэродиск ENGINE-5 с двумя процессорами Intel Xeon E5-1650 v4, 64 ГБ оперативной памяти, 24 дисками SAS SSD по 1,8 TB и с 2 картами FC 16G
Были созданы дисковые группы DDP, задействованы все доступные накопители. После этого были подготовлены 4 логических тома (LUN) объемом 500 ГБ каждый для каждой группы DDP с уровнем защиты RAID-10.
Важно отметить, что в системе для использования протокола ALUA доступны два варианта интерфейса: NTB или INTER. В разных моделях СХД могут использоваться различные интерконнекты, в данном случае применялся NTB. Далее все логические тома были презентованы серверу.
В ходе тестирования моделировались два сценария отказа путей СХД: отказ путей A/O при случайной нагрузке блоками 4k и отказ путей A/O при последовательной нагрузке блоками 128k.
Длительность теста составляла 30 минут. После 10 минутной нагрузки на первом контроллере моделировался отказ путей A/O за счет отключения двух таргетов FC. Далее в течение 5 минут производилось наблюдение за пропускной способностью, IOPS и задержкой. Далее отключенные таргеты FC восстанавливались и производилось аналогичное отключение для второго контроллера. Для случайной нагрузки блоками по 4К загрузка процессора в среднем составила 40-45%, а утилизация памяти - 30%. После отказа оптимальных путей и переключения нагрузки через интерфейс NTB произошло падение скорости и рост задержки, однако показатели остаются на приемлемом уровне.
В тесте с последовательной нагрузкой блоками 128К наблюдалась более высокая утилизация интерфейса NTB при отказе путей FC. Нагрузка достигает практически максимума по пропускной способности (в данном случае 2х16ГБ).
В обоих вариантах тестирования при отключении таргетов FC группа остается на своем контроллере, и вся нагрузка на логические тома проходит по неоптимальным путям NTB, производительность при этом снижается, но некритично. Таким образом, в тесте система хранения АЭРОДИСК продемонстрировала достойные показатели отказоустойчивости.